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摘要 
随 着 科学 技术 的 发 展 ,， 脑 电信 号 因为 蕴含 丰富 的 生理 、 心 理 和 病理 内 容 ， 而 
被 运用 与 越 来 越 多 的 领域 。 经 过 在 脑 电信 号 的 数据 集 上 的 相关 实验 表明 ， 本 项 目 
实现 的 基于 使 用 基于 BLSTM 和 LSTM 模型 对 阿尔 北海 默 症 的 判别 取得 了 较 好 的 结 
果 ， 平 均 准确 率 为 93% 左 右 。 
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1 研究 背景 


阿尔 北海 默 证 (Alzheimer s disease) 是 一 种 常 出 现 于 老年 群体 中 的 神经 性 
脑 疾 病 , 是 全 球 第 四 大 死亡 原因 。 其 通常 以 记忆 渐进 性 丧失 和 认 知 功能 退化 为 特 
征 ， 患 者 逐渐 从 正常 老年 人 转变 为 轻 度 认 知 障碍 ， 随 着 患 病 时 间 神 经 元 及 其 连接 
被 逐渐 破坏 ， 导 致 认 知 功能 丧失 , 最 终 成 为 老年 痴呆 。 我 国 2019 年 的 报告 显示 ， 
我 国 中 老年 群体 中 大 约 有 6% 的 人 患 有 老年 痢 采 ，1000 万 人 以 上 正在 经 受 着 疾病 
带 来 的 痛苦 。” 

阿尔 效 海 默 症 病症 情况 较 多 且 复 杂 , 诊断 需要 大 量 的 检查 , 而 具备 全 套 早期 
诊断 的 医院 寥寥 无 几 ， 加 上 病理 检查 费用 高 昂 等 多 重 原因 , 使 得 阿尔 兹 海 默 症 诊 
断 技 术 和 手段 上 亦 面临 难题 。 此 外 我 国 老年 人 群体 所 占 社会 比例 日 益 增加 ， 加 之 
人 民 群 众 “ 看 病 难 ”这 一 问题 还 未 完全 解决 , 我 国 现 有 的 医疗 卫生 资源 配置 不 合 
理 , 偏远 贫困 地 区 享有 的 医疗 资源 相 比 于 一 线 城市 少 之 又 少 。 正 因 如 此 ,我国 的 
阿尔 北海 默 症 患者 在 诊断 时 超过 半数 的 人 都 已 经 是 中 重度 患者 。 而 阿尔 北海 默 症 
越 早 治疗 治愈 的 可 能 性 就 越 高 , 因此 如 何 早期 诊断 出 阿尔 兹 海 默 症 具 有 重要 研究 


EN [2] 
意义 。 


脑 电 图 (Electroencephalogram，EEG) 信号 是 通过 在 头皮 上 放置 电极 或 佩戴 
电极 帽 ， 用 于 记录 脑 细 胞 群 的 自发 性 、 节 律 性 电 活 动 的 技术 方法 。 被 广泛 用 作 临 
床 科研 ,用 以 检测 和 鉴别 多 种 脑 部 病变 和 识别 大 脑 疾 病 ， 它 是 神经 科 医 生 和 临床 
专家 诊断 疗 病 、 睡 眠 障碍 、 精 神 分 裂 症 、 预 测 疗 病 改作、 抑郁 症 、 等 的 主要 工具 
ss 

综 上 ， 本 文 将 基于 以 上 背景 ,通过 使 用 脑 电 信号 数据 ,结合 深度 学 习 模 型 实 
现 阿尔 北海 默 症 的 诊断 。 


2 相关 技术 

长 短期 记忆 网 络 (LSTM，Long Short-Term Memory，LSTM) 是 一 种 时 间 循 
环 神经 网 络 ， 是 为 了 解决 一 般 的 RNN (循环 神经 网 络 ) 存在 的 长 期 依赖 问题 而 
专门 设计 出 来 的 , 所 有 的 RNN 都 具有 一 种 重复 神经 网 络 模块 的 链 式 形式 。 在 标准 
RNN 中 ， 这 个 重复 的 结构 模块 只 有 一 个 非常 简单 的 结构 ， 例 如 一 个 tanh 层 。 

由 于 梯度 爆炸 和 梯度 消失 现象 的 存在 , 简单 循环 神经 网 络 模型 误差 处 理 长 距 

离 序 列 数据 。 为 了 解决 误差 不 能 长 距离 反 向 传播 的 问题 。1997 年 , Sepp Hochreiter 

和 Jiirgen Schmidhuber 提出 了 一 种 改进 的 循环 神经 网 络 , 称 为 长 短 时 记忆 网 络 ”。 
这 种 神经 网 络 最 大 的 特点 是 可 以 免 简单 循环 神经 网 络 梯度 消失 问题 , 因此 在 工业 

界 得 到 了 广泛 的 应 用 。 

在 单 向 的 循环 神经 网 络 中 , 模型 实际 上 只 使 用 到 了 “上 文 ” 的 信息 , 而 没有 
考虑 到 “下 文 ” 的 信息 。 在 实际 场景 中 , 预测 可 能 需要 使 用 到 整个 输入 序列 的 信 
息 。 因 此 ， 目 前 业内 主流 使 用 的 都 是 双向 的 循环 神经 网 络 。 顾 名 思 义 ， 双 向 循环 
神经 网 络 结合 了 序列 起 点 移动 的 一 个 循环 神经 网 络 和 令 一 个 从 序列 末尾 向 序列 
起 点 移动 的 循环 神经 网 络 。 而 作为 循环 神经 网 络 的 一 种 拓展 ，LSTM 自然 也 可 
以 结合 一 个 逆向 的 序列 ， 组 成 双向 长 短 时 记忆 网 络 (Bi-directional Long 
Short-Term Memory, Bi-LSTM) ， 是 由 前 向 LSTM 与 后 向 LSTM 组 合 而 成 。 这 个 想 
法 是 将 负责 正 时 间 方 向 《〈 正 向 状态 ) 的 部 分 和 负 时 间 方 向 的 一 部 分 〈 后 向 状态 ) 
分 割 成 正常 RNN 的 状态 神经 元 ， 对 于 LSTM 的 递归 神经 网 络 有 重大 影响 。 

下 图 展示 了 一 个 双向 LSTM 的 结构 图 : 


图 1 一 个 双向 LSTM 的 结构 图 
LSTM 网 络 模型 结构 描述 如 下 : 


图 2 LSTM 的 网 络 模 型 结构 图 
核心 的 内 容 是 如 何 来 控制 单元 状态 c, 信 息 的 输入 和 输出 。LSTM 采用 三 个 控 
制 开关 或 门 来 决定 单元 状态 的 改变 ,可 以 将 上 述 t 时 刻 的 隐藏 层 简 化 为 如 下 的 示 
意图 。 图 中 可 以 看 出 有 三 个 开关 , 或 称 为 “ 门 ”来 控制 中 间 的 单元 状态 c,， 左 侧 
的 为 遗忘 门 ， 用 来 控制 上 一 个 时 刻 的 单元 状态 c- 继续 在 七 时 刻 保留 ， 下 面 的 为 
输入 门 ， 控 制 当前 时 刻 的 输入 到 长 期 状态 的 信息 。 右 边 的 为 输出 门 ， 控制 当前 时 
刻 t 单元 状态 的 输出 信息 。 


长 期 状态 c 的 控制 
上 一 个 时 刻 的 当前 时 刻 的 
长 期 状态 | 输出 
当前 时 刻 的 
即时 状态 


图 3 LSTM 模型 简化 示意 图 
所 谓 “ 门 ”, 在 算法 的 实现 上 实际 是 一 个 全 连接 层 。 如 下 图 所 示 ，x 是 输入 
向 量 , W 是 门 的 权重 ，o 为 激活 函数 。 


图 4 门 的 结构 示意 图 


上 图 中 ， 门 可 以 表示 为 : 
g(x) = o (Wx + b) 
LSTM 单元 内 部 运算 分 为 三 个 阶段 :遗忘 、 记 忆 和 输出 。 遗 忘 阶段 使 用 遗忘 门 
对 内 部 状态 加 权 , 实现 对 长 期 记忆 的 遗忘 ;记忆 阶段 对 输入 进行 特征 提取 , 同时 使 
用 输入 门将 重要 特征 保存 至 内 部 状态 中 , 完成 长 期 记忆 的 更 新 ;输出 阶段 使 用 输 
出 门 从 内 部 状态 中 挑选 输出 信息 。 


3 基于 LSTM 的 模型 架构 
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图 5 Deep BLSTM-LSTM 模型 架构 

长 短 时 记忆 网 络 具 备 发 现 序 列 数 据 中 潜在 时 序 依赖 关系 的 能 力 ， 因此 ， 本 文 
参考 了 “所 提出 的 Deep BLSTM-LSTM 模型 的 架构 , 大 致 由 9 层 构成 ， 具 有 一 个 
BLSTM 和 两 个 LSTM 层 ， 以 及 Dropout、 批 量 归 一 化 和 全 连接 层 。 

输入 信号 首先 进入 由 256 个 神经 元 组 成 的 Bi-LSTM 层 ， 然 后 经 过 Dropout 
层 。 接 下 来 , 执行 批量 归 一 化 , 将 结果 馈送 到 包含 128 个 隐藏 神经 元 的 LSTM 层 。 


然后 应 用 另 一 个 批量 归 一 化 层 ， 该 层 之 后 是 另 一 个 具有 64 个 隐藏 神经 元 的 LSTM 
层 和 另 一 个 归 一 化 层 。 最 后 依次 进入 两 个 全 连接 层 。 

该 模型 以 端 到 端的 方式 对 原始 脑 电信 和 号 进行 如 下 处 理 : 

《1) 形 态 特征 提取 , 通过 提取 正常 与 阿尔 北海 默 症 患者 脑 电信 号 中 的 特征 ， 
进行 学 习 。 本 文通 过 双向 LSTM 神经 网 络 提取 挖掘 脑 电 信号 中 的 形态 特性 .此 外 ， 
在 Bi-LSTM 后 加 入 一 个 Dropout 层 防 止 过 拟 合 现象 。 

《2) 特征 增强 ， 利 用 LSTM 学 习 信号 样本 间 的 时 序 依赖 关系 ， 强 化 特征 。 经 
过 LSTM 层 后 转化 为 含有 信和 号 特性 和 时 序 依 赖 关 系 的 组 合 ， 在 Dense 层 中 深化 特 
征 并 调整 尺寸 。 


4 实现 步骤 
4.1 数据 预 处 理 
在 所 使 用 的 数据 集中 ， 每 一 个 文件 格式 为 1024 x 19， 数 据 的 数量 比较 少 。 
为 了 扩充 数据 集 以 及 后 续 模 型 更 好 的 处 理 数据 , 在 数据 预 处 理 阶段 对 数据 进行 裁 
剪 ， 将 其 分 割 为 32 x 19 的 大 小 ， 并 按 一 定 的 编号 顺序 存储 为 新 的 txt 文件 。 
此 外 , 本 阶段 中 为 不 同类 型 的 文件 设计 了 标签 , 健康 标记 为 “ 0”, 患者 标 
记 为 “1”, 并 将 标签 保存 至 txt 文件 中 。 


4.2 数据 封装 
将 预 处 理 后 的 数据 ， 封 装 为 一 个 类 ， 继 承 于 Dataset， 重 写 其 中 的 函数 , 便 
于 后 续 读 取 、 加 载 数 据 等 操作 。 编 写 1oad_mydata 函数 ， 便 于 加 载 数据 集 。 


4.3 数据 分 类 

关于 数据 分 类 和 加 载 : 

将 全 部 数据 读 入 ,加 载 中 打 乱 顺序 。 按 照 一 定 比 例 将 数据 划分 为 训练 集 以 及 测试 
集 。 (train、test) 

在 存放 文件 名 与 标签 对 应 关系 的 txt 文件 中 , 按照 与 相同 比例 , 划分 测试 集 和 训 
练 集 的 存放 文件 名 与 标签 对 应 关系 为 两 个 txt 文件 。 


4.4 训练 和 测试 


训练 按照 通用 四 步 走 策略 开展 : 


(1) 计算 当前 网 络 权重 下 的 正 向 输出 结果 和 实际 结果 的 损失 
(2) 梯度 置 0， 防 止 梯度 累计 ; 
(3) 反 向 传播 ; 


(4) 梯度 下 降 ， 执 行 一 步 参数 更 新 。 采 用 一 轮训 练 ， 一 轮 测 试 的 方式 。 


5 实验 结果 及 分 析 


5.1 数据 集 


数据 集 选 用 基于 脑 电 图 诊断 阿尔 痰 海 默 病 的 分 位 数 图 。 该 数据 集 由 Dennis 
Duke 博士 和 佛罗里达 州立 大 学 的 其 他 研究 人 员 共 同 设计 ， 使 用 Biologic 
Systems Brain Atlas III Plus 工作 站 从 国际 10-20 系统 的 19 个 头皮 位 点 记 
录 下 来 。 组 A 和 B 代表 对 照 组 , 由 24 名 健康 的 老年 人 组 成 ， 所 有 的 神经 或 精 
神 疾病 均 呈 阴性 。C 组 和 D 组 由 24 名 可 能 的 阿尔 兹 海 默 症 患者 组 成 ， 这 些 患 
者 通过 国家 神经 和 交流 障碍 和 中 风 研 究 所 和 阿尔 欧 海 默 病 及 相关 疾病 协会 
(NINCDS-ADRDA) 以 及 精神 障碍 诊断 和 统计 手册 (DSM) -III- 诊断 出 R 标准 。 


5. 2 评估 指标 

准确 率 : 

对 于 给 定 的 测试 数据 集 , 分 类 模型 中 所 有 预测 正确 的 样本 数 / 总 观测 值 的 样本 数 。 
在 代码 实现 中 ， 对 完全 匹配 的 预测 样本 ， 进 行 计数 ， 除 以 全 部 的 样本 数 。 


5. 3 超 参数 优化 

超 参 数 的 设置 是 为 了 更 好 的 学 习 数 据 的 结构 ， 保 证 模型 不 出 现 过 拟 合 等 现 
象 。 超 参数 是 控制 模型 结构 、 效 率 、 性 能 等 的 重要 按钮 ， 可 以 调节 学 习 率 、 迭 代 
次 数 、 隐 层 数 目 、 激 活 函 数 、 优 化 器 等 等 。 


1. 学 习 率 优化 

首先 对 不 同 初始 学 习 率 进行 比较 。 在 学 习 率 分 别 为 0.1、0.01、0.001 下 开展 
实验 。 如 图 所 示 ， 在 学 习 率 为 0.01 时 ， 曲 线 变 化 更 加 平滑 ， 能 得 到 效果 更 好 的 
模型 。 
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图 6 不 同学 习 率 下 准确 率 比较 


2. 优化 器 选择 

@ 随机 梯度 下 降 SGD ， 每 次 选择 一 个 mini-batch， 而 不 是 全 部 样本 ， 使 
用 梯度 下 降 来 更 新 模型 参数 。 它 解决 了 随机 小 批量 样本 的 问题 ， 但 仍然 
有 自 适 应 学 习 率 、 容 易 卡 在 梯度 较 小 点 等 问题 。 

@ 目 适 应 梯度 下 降 ，AdaGrad， 是 梯度 下 降 优 化 算法 的 扩展 。AdaGrad 是 一 
种 具有 自 适 应 学 习 率 的 梯度 下 降 优 化 方法 。 它 使 参数 的 学 习 率 自 适 应 ， 
非常 适合 处 理 稀 疏 数据 ， 可 大 大 提高 SGD 的 鲁 棒 性 。 

@ Adan 优化 器 , 结合 AdaGrad 和 RMSProp 两 种 优化 算法 的 优点 , 参数 的 更 
新 不 受 梯度 的 伸缩 变换 影响 ， 超 参数 具有 很 好 的 解释 性 ， 且 通常 无 需 调 
整 或 仅 需 很 少 的 微调 。 
选择 了 以 上 三 种 优化 器 在 数据 集中 进行 相同 迭代 周期 的 实验 , 结果 如 下 

表 所 示 。 


表 1 不 同 优 化 器 下 的 比较 


| 训练 集 损失 测试 集 损失 ”| ”测试 集 准确 率 


AdaGrad 0. 163 0. 269 0. 895 
0. 134 0. 236 0. 916 


根据 表 中 数据 可 知 ，Adan 优化 器 在 相同 迭代 周期 内 比 SGD 和 AdaGrad 优化 
器 损失 率 下 降 速 度 更 快 ， 准 确 率 更 高 。 


5.4 实验 结果 


基于 5. 3 对 模型 超 参数 的 优化 后 ， 调 整 模 型 ， 设 置 学 习 率 为 0.01， 开 展 训 
练 测试 。 图 7 展示 了 训练 和 测试 集 的 损失 值 随 周期 的 变化 关系 。 损 失 值 随 着 训练 
周期 的 深入 ， 均 呈现 了 下 降 趋 势 。 


一 一 train_loss 


一 一 test_|loss 


院 六 种 
La 
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7 训练 和 测试 阶段 损失 值 随 周 期 变化 图 


8 显示 了 训练 20 个 周期 的 损失 值 和 准确 率 变化 , 从 结果 绘制 的 图 像 来 看 ， 
准确 率 趋 近 于 1， 损 失 值 逐 渐 收 敛 。 


Model accuracy&loss 


图 8 训练 20 个 epoch 的 准确 度 和 损失 值 示 意图 


6 总 结 


随 着 科学 技术 的 发 展 ， 脑 电信 和 号 因为 列 含 丰富 的 生理 、 心 理 和 病理 内 容 ， 而 
被 运用 与 越 来 越 多 的 领域 。 
经 过 在 脑 电信 号 的 数据 集 上 的 相关 实验 表明 ， 本 项 目 实现 的 基于 使 用 深度 
BLSTM-LSTM 模型 对 阿尔 北海 默 症 的 判别 取得 了 较 好 的 结果 ， 平 均 准 确 率 为 93% 
左右 ， 说 明 脑 电信 号 或 许可 以 辅助 阿尔 北海 默 症 的 判别 。 本 项 目 数 据 与 代码 可 在 
https://gitcode. net/lhb_taylor/bilstm-lstm 中 找到 。 


从 绘制 的 曲线 图 ， 可 以 看 出 ， 在 测试 集中 ， 存 在 轻微 过 拟 合 的 问题 ， 尝 试 增 
加 Dropout 层 等 操作 后 , 没有 明显 改善 .希望 后 续 有 时 间 可 以 继续 探寻 解决 方案 。 
与 传统 的 机 器 学 习 方 法 相 比 ， 深 度 学 习 对 海量 训练 数据 的 依赖 性 非常 强 ， 因 为 它 
需要 大 量 的 数据 来 理解 数据 的 潜在 模式 。 本 项 目 使 用 的 数据 集 较 小 ， 虽 然 对 数据 
进行 了 分 割 处 理 来 扩充 样本 ， 但 数据 量 偏 少 ， 考 虑 使 用 few-shot 以 及 迁移 学 习 
来 优化 模型 ， 关 于 如 何 提高 训练 的 效率 、 如 何 改进 网 络 模型 等 仍然 需要 进一步 研 


分 * 己 
究 实 验 。 
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